老码农的AI漫谈
“ 不认识整体就不可能认识局部,同样,不认识局部也不可能认识整体。” ——布莱士·帕斯卡(Blaise Pascal)
AI 切实地来到了人们的身边,从迷惑到振奋,从憧憬到期盼,从百家争鸣到百花齐放,从每个人到每个组织,都在或多或少地在寻找自己的定位。作为一个从业者,曾经试图从计算机的体系结构解读AI的构成(参见《老码农眼中的简明AI》),试图从溯源中看到AI的成长(参见《人工智能简史》读后),试图从伦理学角度审视AI的约束(参见《人工智能伦理学的一知半解》)......
但是,老码农仍然妄想对AI有一个整体性的全貌,然而能力所限,原以为的AI体系架构演变成了漫谈。下面是本次漫谈的目录:
AI 的诞生与三次浪潮
AI 的含义解读
AI 的技术体系
AI 的应用领域
AI 对社会的影响
AI 的未来
“治学先治史”,时光回溯,看一看AI出现在历史长河中的位置吧。
1. AI 的诞生与三次浪潮
在共和国诞生的第二年(1950年),图灵发表了一篇划时代的论文,提出了著名的图灵测试( The Turing Test)——
在测试者与被测试者(一个人和一台机器)隔开的情况下,通过一个装置(例如 显示器与键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。这是从现象和结果表象来判定AI的一种方式。
从1950年至1970年形成了AI早期发展的热潮,形成了符合主义,连接主义和行为主义三大主要的AI学派。符号主义认为AI 源于数理逻辑,其原理主要为物理符号系统假设和有限合理性原理。连接主义认为AI源于仿生学,特别是对人脑模型的研究,其主要原理为神经网络及神经网络间的连接机制与学习算法。行为主义认为AI源于控制论,其原理为控制论及感知-动作型控制系统。进而,专家系统一度被认为是AI 的典型代表。专家系统是基于AI的计算机系统,其内部含有大量的某一领域专家水平的知识,系统能利用这些知识和解决问题的方式来处理该领域的问题。
1956年,达特茅斯会议标志着AI 的诞生,除了那张广泛传播的照片之外,下图是那次会议中被成为“AI之父”的科学家们——
在“AI寒冬”之后,在语音识别领域中,统计学派逐渐取代了专家系统,机器学习成为AI实现的主力军。机器学习是通过计算机来模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构并使之不断改善自身的性能。同时,神经网络开始应用于模式识别等领域,使得连接主义重获新生。统计学的应用,机器学习和神经网络形成了1980~2000年间AI的第二次发展浪潮。
随着互联网的兴起,大数据得到了广泛的应用,在2006年后形成了第三次发展的浪潮。简单地,大数据是指无法在一定时间内用常规软件采集、管理并处理的数据集,需要新的处理模式才能具有更强的决策力、洞察力和流程优化能力,才能处理的海量高增长并且具有多样性的信息资产(可以参见《架构大数据应用》)。非深度的机器学习仍然有着典型的应用场景,而深度学习开始占领高地。深度学习是指通过组合低层次特征形成更加抽象的高层次特征来表示属性类别,进而发现数据的分布式特征。在机器视觉、语音识别、机器翻译等领域,深度学习有着普遍的应用,同时促进了强化学习,迁移学习,生成对抗网络等新技术的发展。其间的一个标志性事件,是AlphaGo的人机围棋大战。
关于AI发展的更多通俗性解释,可以参考《人工智能简史》。
那么,AI 到底是什么呢?
2. AI 的含义解读
普通人对AI的认识往往来自于科幻电影,从《星球大战》到《终结者》,从《太空漫游》到《星际穿越》。然而,电影是虚构的,那些电影中的角色也是如此,使人们觉得AI往往缺乏真实感。
AI 是近似于人类的生物学大脑么?
AI 是近似于人类的思考逻辑么?
AI 是近似于人类的行为方式么?
......
从实用的角度看, AI 是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门技术科学,是计算机科学的一个分支。
通俗地,人们把AI划分为不同的层次——弱AI,强AI和超级AI。弱AI是擅长于单个领域的人工智能,比如AlphaGo。强AI也称通用AI,是人类级别的人工智能,是指在各个方面都能和人类比肩的AI。创建强AI比创造弱AI要困难的多,因为智能是一种宽泛的心理能力,能够进行思考、计划、解决问题、快速学习并从经验中学习,能够抽象思维并理解复杂理念,强AI在进行这些操作时和人类一样,这已经有了造物主的味道。超级AI则是在几乎所有领域都比人类大脑聪明,包括通识、社交和科学创新,这是“Matrix”么?
一般地,人工智能科学主要是研究和开发出智能实体,在这一点上它属于工程学。AI的基础学科包括数学、逻辑学、系统学、控制学、计算机科学等,还包括哲学、心理学、生物学、神经科学、仿生学、经济学和语言学等其他学科的研究,是一个集数门科学精华于一身的尖端科学,是一门综合学科。
3. AI 的技术体系
既然AI是一门综合的科学,那AI技术体系是怎样的呢?
根据波普尔的知识进化图谱,发现问题是科学成长的起点,可以尝试对AI的技术体系做如下分类:
问题领域
学科基础
实现方式
AI 所处理的问题领域
语言识别、语言理解和机器翻译是AI的重要领域,自然语言处理(NLP)是人工智能头顶上的皇冠。字符识别、手写识别和机器视觉是AI的又一重要领域,而知识推理和自动控制则是反馈处理的核心方面,处理这些领域的问题,才使得AI 具备了类似“听说读写”的能力。
(来自 gogeometry.com)
AI 体系的技术基础
AI技术体系基础可能就是数学、计算机和数据。从微积分到线性代数,从集合论到概率统计,图论、信息论和博弈论等都在AI所处理的问题领域中得到应用。
如果数学是AI的理论基础,则计算机科学是AI的实现工具和方式。理解计算机组成原理,掌握编程语言并熟知操作系统,从计算机网络与通信到分布式系统,这些可能都是构建人工智能系统不可或缺的要素。“巧妇难为无米之炊”,AI技术体系的基石是数据,尤其是大数据的应用。
数据、信息、知识、洞见和智慧的关系如下图所示——
国外有一高手将相关技术绘制成了一张地铁路线图——
无独有偶,国内的高手们画了一张类似的图,只不过叫做“数据科学家能力发展路线图”。
简单地,数据(包括领域知识),数学(包括各种算法)和计算(包括分布式系统)构成了AI的核心基础。
AI 的技术实现方式
目前,AI 系统的技术实现方式可能主要是通过机器学习包括深度学习来实现的。机器学习的简要分类如下:
机器学习的基础是评估方法和特征工程,算法和模型是机器学习的核心。机器学习的算法众多,从线性回归到逻辑回归,从决策树模型到支持向量机,从贝叶斯分类到K均值聚类,当然还有当红的基于神经网络的深度学习,常见的有CNN,RNN,GAN,LSTM以及各种算法的变种。在机器学习中,常见的转换函数如下——
从计算机的体系架构来看,机器学习的计算架构按粒度从小到大可以分为:
AI芯片->
库与计算框架->
虚拟化容器->
分布式计算->
云服务
始于硬件芯片,止于云服务,中间可能还可以分为更多的层次。AI芯片多用于硬件加速,很多企业也都在这个领域发力,例如 百度的NLP芯片——鸿鹄,一张AI芯片的不完整统计图如下:
用于机器学习的库和计算框架丰富多彩,按音序排列有——
Caffe
Microsoft CNTK
MXNET
PaddlePaddle
scikit-learn
TensorFlow
Theano
Torch
目前还在增长中,不再一一列举。
从部署方式上看,基于Docker 虚拟化容器的AI计算环境已经有相对成熟的方案,基于Hadoop 和 spark 的分布式架构应用广泛,基于对算力的渴望,提供AI计算能力的云服务给人们带来了福音,支持机器学习的云服务有Google的Cloud ML,微软的 Azure ML以及Amazon 的ML等等。
数据的可视化解决方案是机器学习中的一个重要环节,同时,知识图谱、统计模型、遗传算法、博弈算法等等,也都有着典型的应用场景。
那么,能够应用AI 的领域有哪些呢?
4. AI 的应用领域
借用计算机网络中的一个概念,所有具备控制平面的地方都有AI的用武之地。
在互联网和移动互联网应用中,搜索与推荐,文本、图像和视频的内容理解与检索,精准营销、用户画像和反欺诈,语音和自然语言的交互,都可能是最早使用AI技术的应用领域。
智慧交通是一个泛行业的概念。在“百度2020”中,Apolo的靓丽风景是自动驾驶一个写照。感知、规划和控制,从传感器到整车集成,从高精度地图到车联网,自动驾驶是一个系统工程。智慧公路网络是智慧交通的又一基础设施环境,自动的物流车辆和物流机器人配置智能物流规划,是智慧交通中的又一个大场景。
无论是银行业还是保险业,风控和反欺诈都是人们想到的重要AI应用,也很容易联想到投资决策和精准营销,还有作为成本中心之一的智能客服。对于证券、基金、投行等行业,面向AI的量化交易是个吸引人的主题。以上诸多行业的AI应用领域,就是智能金融。
智慧医疗关系到国计民生,从拥有康复的智能设备到手术机器人,从病例理解和检索到医学影像的智能判读,都可以形成辅助诊断。AI 对医疗领域而言,可能是又一次革命。
从智能制造业到智慧农业,从AI驱动的娱乐业到AI文章写作乃至艺术创作,AI可能正在全方位地改变这个社会。
当然,我们对AI 的日常体验大多来自智能家居的家用机器人或者服务机器人,可以在一定程度上实现老幼陪伴和各种生活服务。作为这个方向上的一个从业者,真心希望小度系列产品能够人们的生活带来更多的便利和欢乐。
5. AI 对社会的影响
随着AI在各个应用领域的落地,人与机器的分工,使得大规模的产业变革成为可能,很多的商业模式将会重新洗牌。
然而,在硬币的另一面,由于大量重复性的工作会被机器人取代,会导致很多人失业,从而带来一系列的社会问题。利用AI,有钱人可能变得更有钱,可能会进一步拉大贫富差距,也可能会加剧地区发展的不平衡。AI 对社会经济的影响可能令人始料未及。
对个体而言,可能担心失业和社会保障的问题,更重要的是心理层面的影响,自我价值与自我实现?在智能人机交互的时代,心理学可能面临更大的挑战。一个AI的陪伴会给老人带来怎样的心理感受呢?会不会影响儿童的情感成长呢?......, 很遗憾,目前我们并不知道。
那么,窥探一下时间的长河,AI 会有怎样的未来呢?
6. AI 未来的疑问
AI 的未来很多来自于科幻文学,科幻作品中的人工智能可能是机器人、人机结合体以及非人形的智慧机器,但都实现了人机互联。人类和机器人的关系如何处理才能确保人类的利益,而且达到各方面的平衡,难道只是阿西莫夫的机器人三定律吗?
智慧的本质是什么?
人类可以拥有人工智能,那么人类的命运是什么,是费米悖论么?
时间是有限的还是无限的呢?
人类是渺小的,那么宇宙的终极命运又是什么?
......
一句结束语
庄子说,“吾生也有涯,而知也无涯。以有涯随无涯,殆已!” 但是,如果没有学习和认知,如果没有探索和奉献,如果没有责任和爱,那么人生的长短又有什么意义呢?
【关联阅读】